5.5 运行维护


5.5.1 概述
    云计算数据中心运行维护管理除满足SJ/T 11564.4-2015的要求外还需要满足以下要求:
    a)宜支持对运维对象进行数据的采集和监控,并评估可能导致运维服务对象故障的因素;
    b)宜支持按照定制的服务级别协议管理运维服务的交付过程,并提供过程管理工具;
    c)宜支持自动化辅助。
5.5.2 场地及场地设施运行维护要求
    场地及场地设施运行维护要求包括:
    a)应对云计算数据中心的供配电系统进行定期巡检,包括设备的物理巡检、发电机的空载与带载测、不间断电源的放电测试,以及供配电厂商的例行维护;
    b)应定时检查云计算数据中心机房的环境温湿度,确保机房始终处于恒温、恒湿、新风状态,监控空调系统运行情况,发现问题及时处理,定期组织厂商对空调和新风系统进行例行预维护;
    c)应对云计算数据中心的消防系统进行定期巡检,记录消防系统的运行情况,定期组织消防培训和演练,以及消防设备厂商的例行预维护;
    d)应建立云计算数据中心的集中监控系统,对机房的供配电、温湿度环境、漏水、空调、安全等重要设施进行集中监控,发现问题及时报警;
    e)应建立完善有效的安全管理制度和流程,确保云计算数据中心的机房安全、人员安全、物理安全、系统运行安全、数据安全。
5.5.3 资源池的运行维护要求
    资源池的运行维护要求包括:
    a)应满足SJ/T11564.4-2015的要求;
    b)应建立统一的云计算管理平台实现对资源池的监控和运行维护管理;
    c)应建立对云计算数据中心物理设备的定期巡检制度,确保物理设备的稳定运行,发现问题及时处理;
    d)应基于云计算管理平台建立对资源池的监控平台,实现对各类虚拟资源池的容量监控和性能监控,包括资源池的容量状况、虚拟资源的分配、使用状况、配置变更、健康属性、安全事件等,发现问题能及时告警;
    e)应基于云计算管理平台实现对资源池的服务管理,包括资源调度、自动化部署、统一分配和回收、性能优化、系统升级、脆弱点改进、事件驱动响应和服务请求响应等;
    f)应支持对资源池各类资源的常规操作进行日志记录,并对日志进行备份、分析,实现对资源池的行为管理和操作审计;
    g)应支持对资源池的各类资源进行分区和分级管理,并针对云资源用户及云资源管理员建立不同的用户界面,以展现不同角色的服务、职责及权限,实现面向多租户的自服务;
    h)应通过云计算管理平台实现对业务数据的备份、恢复、镜像、复制等功能,确保资源池内的业务数据的安全性;
    i)应建立针对不同租户的身份认证和访问权限管理机制,并宜建立权限与身份绑定的机制,使用户能通过统一的门户登录对其限定的资源进行合规性操作;
    j)应通过统一的下载与补丁管理平台对资源池内各虚拟机的软件版本进行升级和补丁。

查找 上节 下节 收藏 笔记 返回
顶部

目录导航